导读:Mozilla希望让初创公司,研究人员和业余爱好者更容易构建支持语音的应用,服务和设备。为此,它今天发布了最新版本的Common Voice,这是一个开源的语音数据集,现在包括来自42000名贡
发表日期:2019-09-02
文章编辑:兴田科技
浏览次数:10098
标签:
Mozilla希望让初创公司,研究人员和业余爱好者更容易构建支持语音的应用,服务和设备。为此,它今天发布了最新版本的Common Voice,这是一个开源的语音数据集,现在包括来自42000名贡献者超过1400小时的语音样本,涵盖18种语言,包括包括英语、法语、德语、荷兰语、Hakha Chin语、世界语、波斯语、巴斯克语、西班牙语、中文、威尔士语和卡布语。
Mozilla声称,它是同类语言中最大的多语言数据集之一,比8个月前公开的普通语音语料库要大得多,其中包含了2万名英语志愿者500小时,40万份录音,而且语料库很快就会扩大。该组织表示,70种语言的数据收集工作正在通过通用语音 网站 和移动应用程序积极开展。
通用语音可以集成到Deepspeech中,这是一套由Mozilla的机器学习小组维护的开源的语音到文本、文本到语音引擎和经过培训的模型,它不仅包含语音片段,还包含一些自愿者提供的元数据,这些元数据可用于培训语音引擎,如演讲者的年龄、性别等等。
为了简化流程,Mozilla本周推出了一款改进的Common Voice网络工具,可以根据不同的提示进行剪辑,还提供了用于查看、重新录制和跳过剪辑的新控件。此外,它还推出了新的配置文件功能,允许用户跨语言跟踪进度和指标,并添加人口统计信息。Mozilla表示,在接下来的几个月里,它将尝试不同的方法来通过社区努力和新的合作伙伴关系,增加数据的数量和质量。最终目标旨在为那些寻求构建和使用语音技术的人提供更多更好的语音数据。
【来源:cnBeta.COM】
更多新闻
2023
常规网站建设方法的重要性在当今数字化时代,网站是企业与用户之间沟通的重要媒介。。因此,拥有一个现代化...
View details
2023
通过选择一家专业的丽江网站建设公司,您可以为个人或企业打造一个具有专业形象、创新性和用户友好性的网站。丽江网站建设公司提供各种类型的服务,包括网页设计与开发、响应式网站设计、电子商务网站开发、搜索引擎优化和网站维护。通过建设一个高效、安全和具有良好用户体验的网站,您将能够提升企业形象和品牌价值,扩大市场影响力并为客户提供全面的信息和服务。选择一个值得信赖的丽江网站建设公司,让您的网站建设之路更加顺利。
View details
2022
作为三星的主打直板旗舰机型,三星S系列的市场反响素来不错。该系列机型在性能表现以及使用体验上表现颇为...
View details
2019
开源办公套件 OnlyOffice 刚刚宣布,其将在 2.5.4 桌面版本中,引入基于区块链的端到端加密,以实现跨所有平台的安全文档分享。据悉,OnlyOffice 5.2.4 桌面版将允许用户使用 AEX-2
View details